まずは,”中心極限定理”です.
これは,”母集団の平均μ,分散σ2の場合,サンプルサイズが大きくなるにつれて標本平均の分布は,平均μ,分散分散σ2/nに近づく”
というもののようです(統計ウェッブより抜粋)
なんとなく,サンプル数を増やしていくと精度が上がる,というイメージですが,この証明が結構ややこしい...
特性関数....母関数....などを使っていくのが王道のようで,なんとか数式は追えますが,頭に入ってこない...
ざっくりいうと,標準誤差,のようなもんだな,と私は理解しています...(間違いだ!と怒られそうですが..)
ただ,こちら,こちら,がなんとなく直感的に説明されていたので,それをなぞらさせていただきます.
・平均,分散
まずは,母集団の平均μ,分散σ2から,n個の標本の平均m,分散Vを求めていきます.
平均:\(\Large \displaystyle m = \bar{x} = \frac{x_1 + x_2 + ....+ x_i + ....+ x_n}{n} = \frac{1}{n} \sum_{i=1}^{n} x_i \)
分散:\(\Large \displaystyle V = \frac{1}{n} \sum_{i=1}^{n} (x_i - m)^2 \)
この工程をたくさん行った際の,期待値,分散は,
期待値:\(\Large \displaystyle E \left(\frac{ \displaystyle \sum_{i=1}^{n} x_i}{n} \right)
= \frac{E \left( \displaystyle \sum_{i=1}^{n} x_i \right)}{n}
= \frac{n \mu}{n}
= \mu \)
となり,期待値は母集団の平均となります.
分散:\(\Large \displaystyle V \left(\frac{ \displaystyle \sum_{i=1}^{n} x_i}{n} \right)
= \frac{ \displaystyle \sum_{i=1}^{n} V(x_i) }{n^2}
= \frac{n \sigma^2}{n^2}
= \frac{ \sigma^2}{n}\)
となり,平均値の分散は回数nを増やしていくと,徐々に小さくなっていくことがわかります.
これが,”中心極限定理”と今のところ私は理解しておきます....(間違っているかもしれませんが...).
この式は,
\(\Large \displaystyle \frac{ \sigma^2}{n} = \frac{ SD^2}{n}\)
であるので,
\(\Large \displaystyle \frac{ SD^2}{n} \equiv SE^2 \)
と標準誤差の定義ともなります(これがメインの導出かもしれませんが..)
言い訳ばかりの式の展開でしたが...もう少し勉強してみます